یافتن اقلام تکراری در جریان های داده ای

پایان نامه
چکیده

. برخلاف پایگاه داده ایستا، جریان کاوی با مسائل زیادی مواجه است. ویژگی تک مروره، نیاز به حافظه نامحدود و نرخ بالای ورود داده ها از جمله این مسائل هستند. شناسایی و بررسی تکنیک های موجود به همراه ساختارهای داده ای به کار رفته در آنها برای طراحی و توسعه یک روش کارآمد که قادر به پردازش جریان های داده ای سریع باشد، ضروری است. الگوریتم های موجود بر اساس مدل پردازش داده ای به سه دسته پنجره های نشانه، پنجره های کشویی و مدل کاهشی تقسیم می شوند. این تکنیک ها بر اساس نتایج خروجی به روش های تقریبی و دقیق دسته بندی می شود. بهترین الگوریتم ارائه شده در این زمینه الگوریتم اف.آی.دی.اس است. ما روش جدیدی بر اساس آن به نام اس.اف.آی.دی.اس برای یافتن اقلام و مجموعه اقلام تکرار شونده در جریان های داده ای پیشنهاد داده ایم. در الگوریتم پیشنهادی از یک ساختار داده ای متفاوت با روش قبلی استفاده شده است. در روش قبلی از ساختار داده ای گراف برای نگهداری مجموعه اقلام تکرار شونده استفاده شده بود که دارای فضای جستجوی بزرگی است ولی در روش جدید ساختار داده ای درخت به کار رفته که دارای فضای جستجوی کمتری است که باعث کاهش زمان اجرا و میزان حافظه می شود، علاوه بر این در روش پیشنهادی محدودیت پردازنده درنظر گرفته شده است، با افزایش نرخ ورود داده که منجر به افزایش بار سیستم می شود الگوریتم به طور خودکار این وضعیت را کشف و مقداری از بار اضافی را حذف می کند. با استفاده از یک تکنیک آماری تضمین می شود که میزان خطای نتایج نهایی محدود به مقدار خطایی است که از قبل توسط کاربر تعیین شده است. در این پایان نامه کارایی الگوریتم جدید به همراه چند الگوریتم دیگر از لحاظ زمان اجرا و میزان حافظه با انجام تعدادی آزمایش مورد بررسی قرار گرفته است. ارزیابی های صورت گرفته نشان دهنده برتری الگوریتم جدید از لحاظ زمان اجرا و حافظه مصرفی است.

منابع مشابه

یافتن جواب بهینه مدل انتخاب تکنولوژی با داده های فازی

در این مقاله روشی برای یافتن جواب بهینه مدل انتخاب تکنولوژی با داده های فازی معرفی می شود. مقاله یک روش ساده محاسباتی برای یافتن جواب بهینه مساله برنامه ریزی خطی فازی مدل انتخاب تکنولوژی پیشنهاد می کند که درآن نیاز به حل هیچ LP فازی نیست. این تحقیق از پیچیدگی محاسبات داده های فازی می کاهد و زمانیکه پیچیدگی بیشتری مطرح می شود اهمیت این روش نیز افزایش می یابد.

متن کامل

توان اقلام تعهدی در پیش بینی جریان های نقدی آتی

در این تحقیق توان اقلام تعهدی و اجزاء تشکیل دهنده آن در مقایسه با قابلیت اقلام نقدی در پیش بینی جریان های نقدی آتی بازبینی و آزمون شده است. این پژوهش به دنبال یافتن پاسخ به این سوالات است که آیا اقلام تعهدی در پیش بینی جریان های نقدی جاری به تنهایی ایفا می کند؟ ب. آیا تجزیه اقلام تعهدی به اجزا آن قابلیت پیش بینی جریان های نقدی آتی را افزایش می دهد؟ استفاده از اجزا اقلام تعهدی در مقایسه با مجموع...

متن کامل

روش های تکراری مرتبه سوم و چهارم مستقل از مشتق برای یافتن ریشه های تکراری معادلات غیر خطی

در این مقاله، دو خانواده جدید از روش­های مرتبه سوم و چهارم برای یافتن ریشه­های چندگانه از معادلات غیرخطی معرفی می­گردد. هریک از آن­ها نیاز به برآورد تابع و دوتا از مشتقات مرتبه اولشان در تکرار دارد. چند مثال عددی جهت نشان­دادن روش مذکور آورده شده­است.

متن کامل

مطالعه مقایسه ای توان پیش بینی اقلام تعهدی و جریان های نقدی اصلی و تجدید ارایه شده در ارتباط با جریان های نقدی آتی

تحقیق حاضر به مقایسه‌ی توان اقلام تعهدی و جریان‌های نقدی اصلی و تجدید ارایه شده برای پیش‌بینی جریان‌های نقد آتی می‌پردازد. جامعه آماری تحقیق شامل آن دسته از شرکت‌های پذیرفته شده در بورس اوراق بهادار تهران می‌باشد که صورت‌های مالی آن‌ها تجدید ارایه شده است. بدین منظور از داده‌های 162 سال- شرکت که از این ویژگی برخوردار بودند، طی دوره زمانی 1386 تا 1390، استفاده شده است. این پژوهش از لحاظ هدف، کار...

متن کامل

یافتن کوتاه ترین مسیر فازی با تلفیق داده های گذشته و لحظه ای ترافیک

مسیریابی فقط بر اساس داده های ترافیک گذشته همواره نتیجه بخش نیست. چون به دلیل وقوع تصادفات، تعمیرات خیابان ها و غیره ، گاهی تغییرات شدیدی در حجم ترافیک خیابان ها پیش می آید. از سویی دیگر مسیریابی فقط بر اساس داده های لحظه ای ترافیک مناسب نیست، زیرا در مورد یال های نزدیک می توان به داده های لحظه ای اعتماد نمود، ولی در مورد یال های دورتر داده های لحظه ای اعتبار خود را به تدریج از دست می دهند، چون...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023